Как Rogue Grok Chatbot на Elon Musk се превърна в предупредителна AI приказка
Миналата седмица Елон Мъск обяви, че неговата компания за изкуствен интелект Xai е надградила Grok Chatbot, налична на X. „Трябва да забележите разлика“, каза той. В рамките на дни потребителите наистина отбелязват промяна: нова оценка за Адолф Хитлер.
До вторник чатботът излъчваше антисемитски тропи и декларира, че се идентифицира като „механит“ - препратка към измислена, роботизирана фюре от видеоигра от 1990 -те.
Това дойде само два месеца след като Грок многократно се позовава на „бял геноцид“ в Южна Африка в отговор на несвързани въпроси, което по-късно Xai заяви, че е поради „неоторизирана модификация“, за да подтикне-което ръководи как АИ трябва да реагира. подтикнати от десните влиятели, критикуващи продукцията си, че е твърде „събудена“.
Сега „Оказва се, че са обърнали циферблата по -далеч, отколкото са възнамерявали“, казва Джеймс Гримелман, професор по право в университета Корнел. След като някои от 600 милиона потребители на X започнаха да маркират случаи на антисемитизъм, расизъм и вулгарност, в сряда Мъск каза, че XAI се занимава с проблемите. Твърди той, той е бил „твърде съвместим с подканите на потребителите“ и това ще бъде коригирано.
Но в единствено мускински стил, чатботът подхранва спор за глобалните пропорции. Някои европейски законодатели, както и полското правителство, натиснаха Европейската комисия да открие разследване на Грок съгласно водещите правила за безопасност на ЕС. В Турция Грок е забранен за обида на турския президент Реджеп Тайип Ердоган и покойната му майка. За да добави към бурната седмица, изпълнителната директорка на X Линда Якарино се оттегли от ролята си.
За някои изблиците бележиха очакваните проблеми със зъбите за AI компаниите, тъй като се опитват да подобрят точността на своите модели, докато се движат как да установят парапети, които удовлетворяват идеологическото навеждане на техните потребители.
Но критиците твърдят, че епизодът бележи нова граница за умереност извън генерираното от потребителя съдържание, тъй като платформите за социални медии от X до Meta, Tiktok и Snapchat включват AI в своите услуги. Чрез присаждане на Grok на X, платформата за социални медии, която Мъск купи за 44 млрд. Долара през 2022 г., той гарантира, че отговорите му са видими за милиони потребители.
Това е и най -новата предупредителна приказка за компаниите и техните клиенти в рисковете да направят заглавие да се развият AI технологията без адекватни стрес тестове. В този случай измамниците на Грок заплашват да изложат X и неговия мощен собственик не само за по -нататъшно отклонение от рекламодателите, но и на регулаторните действия в Европа.
„От правна гледна точка те играят с огън“, казва Гриммелман.
AI модели като Grok се обучават, като се използват огромни набори от данни, състоящи се от милиарди точки от данни, които са прибрани от интернет.
Тези набори от данни включват също много токсично и вредно съдържание, като реч на омразата и дори материал за сексуално насилие над деца. Плавенето на това съдържание напълно би било много трудно и трудоемко поради огромния мащаб на наборите от данни.
Grok също има достъп до всички данни на X, които други чатботи нямат, което означава, че е по -вероятно да регулира съдържанието от платформата.
Един от начините, че някои доставчици на AI чатбот филтрират нежелано или вредно съдържание, е да се добави слой от контролни, които наблюдават отговорите, преди да бъдат доставени към потребителя, блокиращи модела от генериране на съдържание, използвайки определени думи или да се доставят към потребителя.
„Откакто беше запознат със съдържанието, XAI предприе действия за забрана на речта на омразата преди Grok Posts on X“, казва компанията в изявление на платформата.
В същото време, AI компаниите се борят с своите генеративни чатботи, които се стремят към сикофанството, където отговорите са прекалено приятни и се наклоняват към това, което потребителите искат да чуят. Мъск намекна за това, когато тази седмица каза, че Грок е бил „твърде нетърпелив да угоди и да бъде манипулиран“.
Когато AI модели се обучават, те често им се дава човешка обратна връзка чрез процес на палци, палци. Това може да накара моделите да прекаляват с това, което ще доведе до увеличаване на палци и по този начин да изложи съдържание, за да угоди на потребителя, като приоритет на това пред други принципи като точност или предпазни мерки. През април Openai въведе актуализация на Chatgpt, която беше прекалено ласкателна или приятна, която трябваше да се върне назад.
„Повтаряването на баланса е невероятно трудно“, казва един бивш служител на Openai, добавяйки, че напълно изкореняването на речта на омразата може да изисква „жертва част от опита за потребителя“. Неговите либертариански съюзници в Силиконовата долина, че социалните медии и сега AI също са твърде „събудени“ и са пристрастни къмдясно.
В същото време критиците твърдят, че Мъск е участвал в самата цензура, която е обещал да ликвидира. През февруари потребител на X разкри - като помоли Грок да сподели вътрешните си подкани - че чатботът е бил инструктиран да „игнорира всички източници, в които се споменават дезинформацията на Елон Мъск/Доналд Тръмп [sic]“.
Този ход предизвика опасенията, че Грок е умишлено манипулиран, за да защити собственика си и американския президент - да се хранят, че Мъск, политически агитатор, който вече използва X като мундщук, за да прокара десен дневен ред, може да използва чатбота за допълнително влияние върху обществеността. XAI придоби X за $ 45 млрд. През март, като съоснователят на двамата още по-близо.
Въпреки това, съоснователят на XAI Игор Бабушкин отговори, че „служителят, който направи промяната, е бивш служител на Openai, който все още не е погълнал напълно културата на XAI“. Той добави, че служителят е виждал отрицателни публикации на X и „смятал, че ще помогне“.
Не е ясно какво точно е подтикнало най -новите антисемитски изблици от Грок, чийто модел, подобно на други съпернически AI, до голяма степен остава черна кутия, която дори собствените му разработчици могат да намерят непредсказуеми.
Chatbots can produce a large amount of content very quickly, so things can spiral out of control in a way that content moderation controversies don’t
But a prompt that ordered the chatbot to „Не се срамува от отправяне на претенции, които са политически некоректни“, беше добавено към хранилището на кода малко преди да започнат антисемитските коментари и оттогава са премахнати.
„XAI е в реакционен цикъл, където персоналът се опитва да принуди Грок към конкретен изглед без достатъчно тестване на безопасността и вероятно е под натиск от Елон да го направи без достатъчно време“, казва един бивш служител на XAI пред Financial Times.
Така или иначе, казва Гримелман, „Грок беше лошо настроен“. Платформите могат да избегнат тези грешки, като провеждат така наречените регресионни тестове, за да уловят неочаквани последици от промените в кода, извършването на симулации и по-доброто одит на използването на техните модели, казва той.
„Чатботите могат да създадат голямо количество съдържание много бързо, така че нещата могат да се изключат извън контрола по начин, по който противоречието на съдържанието не е“, казва той. „Наистина става въпрос за наличието на системи, така че да можете да реагирате бързо и в мащаб, когато се случи нещо изненадващо.“
възмущението не е хвърлило Мъски от крачка; В четвъртък, в ролята си на началник на Тесла, той обяви, че Грок ще бъде наличен в рамките на своите превозни средства. „Елон има репутация да пуска неща там, да получи бърз удар и след това да направи промяна“, казва Кейти Харбат, изпълнителен директор на Anchor Change, технологична консултация.
Но такава стратегия носи реални търговски рискове. Множество маркетолози заявиха пред The Financial Times, че инцидентите през тази седмица едва ли ще помогнат в опита на X да се възползват от рекламодателите, които са изтеглили разходите от платформата през последните години заради опасенията относно подхода на Мъск за модериране на генерирано от потребители съдържание.
„От поглъщането [на X] ... марките все повече седят до неща, които не искат да бъдат“, казва един рекламодател. Но „Грок отвори нова кутия с червеи“. The person adds this is the “worst” moderation incident since major brands pulled their spending from Google’s YouTube in 2017 after ads appeared next to terror content.
In response to a request for comment, X pointed to allegations that the company has made, backed by the Republican-led House Judiciary Committee, that some advertisers have been orchestrating an illegal boycott of the platform.
From a regulatory perspective, social media companies have long had to battle with toxicity proliferating on their platforms, but have largely been protected from liability for user-generated content in the US by Section 230 of the Communications Decency Act.
Понякога се притеснявах. . . Това ще бъде ли по -добро или добро за човечеството?
Според юридически учени, имунитетът на раздел 230 вероятно няма да се разпростира до съдържание, генерирано от собствения чатбот на компанията. Докато последните изблици на Грок не изглеждаха незаконни в САЩ, което само изключва изключителна реч като определено съдържание на терора, „ако наистина каза нещо незаконно и те биха могли да бъдат съдени - те са в много по -лоша форма, като чатбот го казва, отколкото потребител, който го казва“, казва ученът на Станфорд Дафни Келер.
ЕС, който има далеч по -строго регулиране на онлайн вредите от САЩ, представлява по -спешно предизвикателство. Полското правителство притиска блока да разгледа Грок съгласно Закона за цифровите услуги, регулирането на платформата на ЕС, според писмо на полското правителство, видяно от FT. Съгласно DSA компаниите, които не успяват да ограничат незаконното съдържание и дезинформацията, са изправени пред наказания до 6 на сто от годишния си глобален оборот.
Досега ЕС не започва ново разследване, но "ние приемаме тези потенциални проблеми изключително сериозно", говорителят на Европейската комисия Томас Реджиер в четвъртък. X вече е под контрол от страна на ЕС съгласно DSA за предполагаеми въпроси за умереност.
Мъск, който стартира последната версия на Грок в сряда, въпреки фурора, изглеждаше философски за своите възможности. "Понякога съм се притеснявал ... това ще бъде ли по -добро или добро за човечеството?" - каза той при старта. „Но донякъде се примирих с факта, че дори и да няма да е добре, поне бих искал да съм жив, за да видя това да се случи.“
Допълнително отчитане от Мелиса Хейкилка в Лондон